生成 Deep Learning　絵を描き、物語や音楽を作り、ゲームをプレイする

https://gyazo.com/aca1fd7063cdfd51ca881b01377fcc05

https://www.oreilly.co.jp/books/9784873119205/

生成型ディープラーニングの解説書。「絵を描く」「曲を作る」といった、これまで人間にしかできないと思われていた創造的な作業を機械に行わせるという、いま最もホットな技術の基礎から応用までをJupyterノートブック環境で実際に試しながら学びます。第I部は基礎編です。機械学習プログラミング、変分オートエンコーダ、GANやRNNなど、生成モデルの作成において重要な基礎技術を学びます。第II部は応用編です。CycleGAN、エンコーダ―デコーダモデル、MuseGANなどのモデルを作成し、作画、作文、作曲といった創造的なタスクに取り組みます。さらには、実環境を用いずにゲームプレイの学習を可能にする、世界モデルを使った強化学習にも取り組みます。

賞賛の声

訳者まえがき

まえがき

第I部　生成型ディープラーニング入門

1章　生成モデリング

1.1　生成モデリングとは何か？

データセットがどのように生成されるかを確率モデルの観点から記述する

このモデルからサンプリングすることで新しいデータを生成できる

1.1.1　生成モデリングと識別モデリング

ジェネラティブアート

識別モデリングは観測xが与えられたときのラベルyの確率を推定する

生成モデリングは観測xが観測される確率を推定する

1.1.2　機械学習の進歩

MLaaS

1.1.3　生成モデリングの隆盛

現在の神経科学の理論は、「私達の現実の認識の仕方は、感覚を入力して今何を経験しているかの予測を出力するという高度に複雑な識別モデルではなく、産まれたときから訓練されて、未来に正確にマッチする環境のシミュレーションを出力する生成モデルである」と示唆しています

1.1.4　生成モデリングの枠組み

pmodel

1.2　確率生成モデル

標本空間

観測xが取りうるすべての値の完全な集合

密度関数

確率密度関数

標本空間内の点xを0から1の数字に写像する関数

合計は1

パラメトリックモデリング

有限個のパラメータ群θを使って記述できる密度関数の一種

尤度

L(θ|x)

xが与えられたときのθのもっともらしさ

ふつう対数尤度を使う

最尤推定

ある観測されたデータXを説明する最もありそうな密度関数pθ(x)を推定する

MLE

1.2.1　Hello Wrodl!

1.2.2　最初の確率生成モデル

特徴の異なる組み合わせは全部で4032通り

標本空間には4032個の点がある

多項分布

まだ現れていないものは決して生成できない

加算スムージング

仮想カウントとして1を追加

データから学習された固有の構造によって、より標本空間内にありそうだと信じられる領域に重みを増すようにしたい

1.2.3　単純ベイズ（Naive Bayes）

単純ベイズ仮定

各特徴xjは他のすべての特徴xkと独立であると単純に仮定

p(xj|xk) = p(xj)

確率の連鎖率を使って密度関数を条件付き確率の積として記述

パラメータθを推定し、それらを乗算して可能な各組み合わせの確率を求めることに集約される

元のデータにはなかった新しい例を生成できる

1.2.4　Hello Wrodl!の続き

ピクセルだとうまく生成できない！

1.3　生成モデルの課題

ピクセル値は高度に相関があり、標本空間は広大

特徴間に存在する高度な条件付き、依存性にモデルがどうやって対処するか？

高次元の標本空間から、生成される可能性のあるごく小さい部分の1つの観測を、モデルがどうやって見つけるか？

関連する構造をデータから推察できるモデルが必要

ディープラーニング

1.3.1　表現学習

ある低次元の潜在空間を使って訓練セット内の各観測を記述

その後、潜在空間の中の1点を取り、それを元の領域の一点に写像する写像関数を学習する

与えられた特徴の集合に、単に値を割り当てるだけではない

どの特徴が最も重要か、実際にそれらの特徴を生のデータからどのように生成するかを学習する

https://gyazo.com/bd4a10a2a691a4af520695263aee00f7

高レベルの特徴

1.4　環境のセットアップ

https://github.com/davidADSP/GDL_code/tree/tensorflow_2

tensorflow_2 ブランチにチェックアウトして環境構築すること！

次に、python -m pip install --upgrade pip でpipのバージョンを上げる

Pillow==6.2.0 のインストールに失敗するらしい

python -m pip install Pillow したら 9.2.0 が入った

もっかい install -r requirements.txt を叩く

virtualenv

virtualenvwrapper

1.5　まとめ

2章　ディープラーニング

構造化されていないデータの高レベルな表現を学習するため、積み重なった複数の処理ノートの層を用いる機械学習のあるアルゴリズムの1つ

2.1　構造化されたデータと構造化されていないデータ

構造化されていないデータ

画像、音楽、動画

構造が特徴量の並びという形にはならない

入力される特徴量に意味があり、空間的な依存関係はない

2.2　ディープニューラルネットワーク

一連の積み重なった層

ノードを含む

重みの集合を通して前の層のノードと接続される

全結合層

訓練

予測が最も正確になるようにそれぞれの層の重みを決定する処理

誤差逆伝播

出力が正解と比較された後、予測結果の誤差がネットワークを通じて逆方向に伝播され、それぞれの重みをその予測が最も泳ぐ改善される方向に少しだけ調整する処理

2.2.1　KerasとTensorFlow

2.3　最初のディープニューラルネットワーク

2.3.1　データを読み込む

2.3.2　モデルを作成する

Sequantialモデル

functional API